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Лингвистические и металингвистические 
представления в интеллектуальных 
многоязычных системах 


В данной работе предложен функционально-семантический подход, который обеспечивает синерге- 
тическое сочетание статистических методов и логико-лингвистических правил. В процессе грамматического 
разбора используются значения вероятности каждого узла разбора предложения. Взаимодействие 
функциональных блоков и подсистем интеллектуальной многоязычной системы между собой, а также 
взаимодействие ее с пользователем организуется с помощью метаданных управления и связи. Были 
изучены структуры когнитивного переноса в рамках поля функционального переноса первичной и 
вторичной предикации для русско-французской языковой пары по аналогии с русско-английской 
языковой парой. Материалом анализа послужили параллельные тексты, статьи из научной периодики. 


| Актуальные направления лингвистического 
моделирования для систем машинного перевода 
и обработки знаний 


Современный период развития исследований и разработок в области машинного 
перевода и систем извлечения знаний из текстов характеризуется интенсивным про- 
цессом «гибридизации» подходов и моделей. Потребность в этом носит объективный 
характер. Значительные вычислительные ресурсы современных систем позволяют накапли- 
вать и использовать ранее переведенные текстовые фрагменты, обеспечивать машин- 
ный перевод, основанный на прецедентах («Ехатр!е-Вазед Масбше Тгап$айоп») [1-3], 
эффективно поддерживать компоненту «переводческой памяти» («Тгапаноп Метогу»). 

Создатели систем, основанных на правилах, вводят в правила различные стохасти- 
ческие модели, которые позволяют отобразить динамику и разнообразие языковых форм 
и значений, порождаемых в процессе речевой деятельности, а сторонники статисти- 
ческих методов построения лингвистических моделей все чаще обращаются к подходам, 
основанным на лингвистических знаниях, рассматривая это как средства «интеллектуали- 
зации» систем [4-8]. 

Для машинного перевода наиболее сложной проблемой является реализация язы- 
ковых трансформаций, которые необходимо производить при переводе с одного языка 
на другой. Текущий этап развития систем машинного перевода характеризуется иссле- 
дованиями в области когнитивной семантики, вероятностных языковых моделей и разра- 
боткой семантико-синтаксических представлений, учитывающих многозначность и не- 
однозначность синтаксических структур. 

При создании компьютерных моделей русской грамматики доминировали подходы, 
основанные на грамматиках зависимостей [9] или локально-синтаксических пред- 
ставлениях, при этом не разрабатывались грамматики составляющих. 
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Целью данной работы является разработка методов компактного представления 
структуры составляющих предложения (грамматика фразовых структур), с одной стороны, 
ас другой стороны, учитывает механизмы зависимости между узлами дерева предложения. 


2 Функциональный подход 
к лингвистическому моделированию 


Разработка понятия функции, являющегося центральным в функциональной грамма- 
тике, связана с широкой проблематикой функций языка [10-18]. Функции связаны со 
значениями языковых единиц, но они не тождественны им. Исследование функции не- 
которой языковой формы включает анализ ее значения (или ряда значений в случае 
многозначности). 

На современном этапе лингвистических исследований и разработок необходимо 
синергетическое сочетание функционального и уровневого подходов. Функциональный 
подход интегрирует разноуровневые языковые средства (синтаксические, лексические, 
словообразовательные и словоизменительные) на основе их функционально-семанти- 
ческих характеристик. 

Грамматика данного типа рассматривает в единой системе средства, относящиеся 
к разным языковым уровням, но объединенные на основе их семантических функций; 
при описании языкового материала используется подход «от семантики к ее формаль- 
ному выражению» («от функций к средствам») как основной, определяющий построение 
грамматики, в сочетании с подходом «от формы к семантике» («от средств к функции»). 
Под единицами строя языка подразумеваются, прежде всего, грамматические формы слова 
и синтаксические конструкции, а также единицы «строевой лексики» (по Л.В. Щербе) 
[19]: модальные и фразовые глаголы, слова типа «вчера», «обычно», «часто», «прежде», 
«долго» и тп. Ю.С. Степанов [18] вводит понятие функтора как языкового средства транс- 
позиции одного множества языковых единиц в другое множество языковых единиц того 
же языка. Функция есть свойство или значение функтора. Приводится пример функции: 
если принять за исходное множество единиц русские глаголы типа «сообщать», «выра- 
жать», «исполнять» и т.п., а за производное множество единиц «сообщение», «выраже- 
ние», «исполнение» и нечто «сообщается», «исполняется», то отношение первого мно- 
жества ко второму будет функцией, а языковые формы -ение, нечто -(ает)ся будут языко- 
выми средствами этой функции, функторами. Понятие функции является одним из 
центральных в коммуникативной грамматике Г.А. Золотовой. Функция — это предназна- 
ченность элемента к определенному способу существования в системе, к определенному 
служению этой системе [20]. Функции реализуются при взаимодействии языковых 
объектов и их контекстов. 

Для рассмотрения семантики способов конфигурирования языковых структур мы 
пользуемся понятием структурного знака [21], предложенным в семиотической лингви- 
стике С.К. Шаумяном. При этом слово также рассматривается нами не с точки зрения 
его лексического значения, а как функционально-категориальная единица, минималь- 
ный структурный знак. Такой подход принимается нами как определенный этап исследо- 
ваний структурных знаков, продиктованный необходимостью максимально полного 
извлечения семантической информации из возможных способов конфигурирования 
языковых объектов и изучения когнитивных механизмов линеаризации языковых структур. 

Семиотическая лингвистика вводит понятие суперпозиции функций, полагая, 
что каждый языковой объект обладает исходной первичной функцией, а происходя- 
щие в действующем языке сдвиги значений — это наложение вторичной и других 
функций на исходную. Таким образом, использование инструмента суперпозиции 
[21], [22] категорий дает возможность выразить функциональные свойства языковых 
объектов. 
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3 Изофункциональные трансформации при переводе 


Функциональный подход, исследующий отношения «функциональной синонимии» 
разнородных и разноуровневых единиц языка, чрезвычайно актуален в настоящий момент, 
когда проводятся эксперименты по выявлению изофункциональных и изосемичных 
языковых структур из параллельных текстовых корпусов. Именно этот подход позволяет 
найти соответствия в текстах на разных языках. В самом деле, заранее нельзя с полной 
достоверностью определить, каким именно образом была переведена та или иная языко- 
вая структура в текстовом корпусе. Поэтому необходимо строить и исследовать различ- 
ные гипотезы при проектировании лингвистического процессора. 

Отсутствие полного совпадения между английскими и русскими языковыми конст- 
рукциями в научно-технических текстах можно обнаружить при изучении сравнитель- 
ной частоты употребления в них отдельных частей речи, что важно для построения 
систем перевода, использующих машинное обучение. 

Для научного изложения в целом характерен признак номинативности, т.е. более 
широкое использование существительных, чем в других функциональных стилях. При 
этом сопоставительный анализ переводов показывает, что в русском языке эта тенден- 
ция выражена более четко, и при переводе английские глаголы нередко заменяются 
существительными. Проведенные нами статистические исследования параллельных текс- 
тов позволяют сделать вывод о том, что русский текст приблизительно на 35% более но- 
минативен, чем английский. Рассмотрим следующие примеры глагольно-именных транс- 
формаций при англо-русском переводе. 

1) Тйе ме! зуяет 15 4еяютпе4 10 5юге Паш зазойте апа 1о 4еПуег И ю Ше епоте 
суйптаегу т ше ютт офуарог пихей мий их. 

Система питания предназначается для заправки жидким топливом и подачи 
его в цилиндры в виде смеси паров бензина с воздухом. 

10 5юте ап4 то 4еПуег > для заправки и подачи 

2) А хйптИаг арргоасй йау тагкей ше ЕЦ’5 ефот5 10 ехрапа ше ситтепт! сшБ оГ 15 
соипилеу 10 етЬгасе юттег соттитз1 соипйлез игйег еа51. 

Точно таким же подходом характеризуются усилия ЕС по расширению 
нынешнего клуба 15 стран дальше на восток путем присоединения к нему бывших 
коммунистических стран. 

0 етБгасе > по расширению 

Нами были проведены исследования на материале имеющихся в нашем распоря- 
жении параллельных переводов научных статей и отдельно взятых примеров высказываний 
с исследуемыми конструкциями, а также мы обращались к опросу экспертов-переводчиков. 
Наиболее продуктивные типы глагольно-именных трансформаций при англо-русском пере- 
воде коррелируют со следующими функциональными значениями. 

— Обстоятельства цели и следствия, выраженные инфинитивом (58% в письмен- 
ных переводах и 71% при опросе респондентов — профессиональных переводчиков). 

3) т огаег о ипаегяапАа ше рйепотепоп опе зйошА сопхщег Ше [ам ор тойоп. 

Для понимания этого явления надо рассмотреть законы движения. 

[п ог4ег ю ипаегяапа > Для понимания 

— Составное сказуемое с инфинитивом (Бе + инфинитив) (51% в письменных 
переводах, 59% при опросе респондентов — профессиональных переводчиков). 

4) Тре А/лсиПу и Бе ю омат ше зибЯапсе т диезпоп. 

Трудность будет состоять в получении рассматриваемого вещества. 

ю оМат > в получении 
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— Инфинитив после относительных местоимений \Мсв и \пот с предшествующим 
предлогом часто переводится отглагольным существительным с предлогом «для»; в 
этом случае относительное местоимение с предлогом не переводится (48% в письмен- 
ных переводах и 52% при опросе респондентов — профессиональных переводчиков). 

5) т уасиит тоесшез йауе [агзе 5расе т итсй 10 тоте. 

В вакууме молекулы имеют большое пространство для движения. 

т умсй о тоуе > для движения 

— Адъективные трансформации инфинитива (существительное + инфинитив в 
определительной функции) (практически 100% в обоих случаях). 

6) Тре атоипт! о} роотит 10 Бе обатей гот а игатит ттега[ сап Бе 
тр? сасшеаеа. 

Количество полония, которое должно быть получено из урана, можно 
довольно просто подсчитать. 

0 Бе о Мате > которое должно быть получено 

— Инфинитив в функции второго дополнения (глаголы салзе, 2еф, |еа4, таке + 
инфинитив) (42% в письменных переводах и 58% при опросе респондентов — про- 
фессиональных переводчиков). 


4 Вероятностная грамматика замещения деревьев 


Рассмотрим, каким образом значения вероятности используются в процессе грам- 
матического разбора. Например, вероятностная контекстно-свободная грамматика (РСЕС — 
РгобабШзис Сощех( Егее Отататаг) и вероятностная грамматика подстановки деревьев 
(РТО — РгобабШ5$ис Тгее Забзиийоп Отаттаг) присваивают вероятность (Р) каждому 
дереву разбора Т (т.е. каждому деривату) предложения 5. Эта информация является 
ключевой для разрешения неоднозначности синтаксических структур. Вероятность каждого 
возможного дерева разбора Т определяется как произведение вероятностей всех правил 
у, используемых для развертывания каждого узла и в дереве разбора: 


Р(Т,5) = [ [ р"). (1) 
пеТ 
Вероятность однозначного предложения (т.е. предложения, где нам не надо раз- 
решать неоднозначность) равна вероятности единственного дерева разбора для этого 
предложения, т.е. Р(Т, 5) = Р(Т). Вероятность же неоднозначного предложения равна 
сумме вероятностей всех возможных деревьев разбора (1(5)) данного предложения: 


Р(5)= У». РТ,5)= У. РТ). (2) 
Тег($) Тег($) 

Вероятность полного разбора предложения вычисляется с учетом категориальной 
информации для каждой головной вершины каждого узла. Пусть и — синтаксическая 
категория некоторого узла и, а й(п) — головная вершина узла и, (п) — материнский узел 
для узла и, таким образом, мы будем вычислять вероятность р(и(и)|и, й(и)), для этого мы 
преобразовываем выражение (1) таким образом, что каждое правило становится 
обусловленным своей головной вершиной: 


Р(Т,5) = [ [ р) |п„(п))х Р(Ки) | п„й(т(п))). (3) 


пеТ 
В нашей системе грамматики функциональные значения языковых структур опре- 
деляются категориальными значениями головных вершин. Вероятностные характеристи- 
КИ ВВОДЯТСЯ В правила унификационной грамматики в виде весов, присваиваемых деревьям 
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разбора. Неоднозначные и многозначные синтаксические структуры учитываются в много- 
вариантной грамматике когнитивного трансфера (переноса). Неоднозначность является 
коренным свойством естественного языка и вызывает основные затруднения при создании 
систем машинного перевода. 


5 Метаданные в многоязычной лингвистической 
базе знаний «Интертекст» 


Функционирование интеллектуальных многоязычных систем основывается на 
взаимодействии ряда функциональных подсистем и модулей, обеспечивающих ввод 
обрабатываемого текста и его разметку, распознавание функционально-семантических 
структур введенного текста, построение на их основе набора соответствующих структур 
для результирующих текстов и формирование самих текстов, а также подбор примеров из 
архивов ранее переведенных фрагментов текстов. Кроме того, обеспечивается управление 
функционированием системы и ее настройками, служебными и пользовательскими архи- 
вами, использованием словарей, эффективные управление и поддержка компоненты «пере- 
водческой памяти» [23], [24]. 

Взаимодействие функциональных блоков и подсистем интеллектуальной много- 
язычной системы между собой, а также взаимодействие ее с пользователем организуется 
с помощью метаданных управления и связи. Метаданные, описывающие текущее состояние 
программного комплекса в процессе выполнения задания (метаописание), формируются в 
самом начале сеанса работы пользователя на основе шаблона либо загружаются из вы- 
званного при входе в систему файла описания предыдущего сеанса работы. Во время 
сеанса метаописание модифицируется соответствующими активными модулями програм- 
много комплекса интеллектуальной системы так, чтобы отображать текущее состояние 
системы и проекта, что позволяет при необходимости приостановить заданный процесс 
обработки текста и впоследствии продолжить его с того же самого места, а также из- 
менять текущие настройки и параметры работы [25]. 

Метаданные обеспечивают обмен между подсистемами и блоками информацией о 
текущем состоянии и выполняемых действиях, требуемых для работы внутренних данных 
и ресурсах, а также управление специально сформированными и накопленными кол- 
лекциями данных интеллектуальной системы. Кроме того, метаданные хранят настройки 
программной среды на конкретную задачу и пользователя. 

Наряду с использованием метаданных для организации взаимодействия функцио- 
нальных блоков и подсистем между собой и управлением всей системой, метаданные 
применяются для описания накопленных архивов и коллекций интеллектуальной системы 
и их содержимого, а также их управлением. 

Данные интеллектуальной многоязычной системы можно разделить на две основ- 
ные категории — данные, обрабатываемые системой, и данные, используемые функцио- 
нальными подсистемами для их обработки, обмена информацией между собой, 
настройки системы и управления ее функционированием. В общем случае обрабатываемые 
данные представляют собой текстовые файлы в одном из открытых форматов текстовых 
документов, в частном простейшем случае это может быть предложение, введенное 
пользователем системы в окне ввода. 

Данные, используемые интеллектуальной многоязычной системой, в основном фор- 
мируются в процессе работы системы и представляют собой набор разнородных массивов 
информации, хранящейся в различных форматах. Определенная часть данных форми- 
руется вручную на этапе разработки системы — например, иерархические системы фра- 
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зовых структур, описывающих язык, или коллекция параллельных текстов научных статей 
и патентов на русском, английском и французском языках. Часть данных, например, 
коллекция параллельных текстов, допускает только дополнение информации, тогда как 
другая часть, например, файлы конфигурации или истории работы, регулярно расши- 
ряются, обновляются и изменяются. 

Интеллектуальная многоязычная система использует следующие категории данных: 

— коллекции параллельных текстов научных (статьи из различных областей науки) и 
патентных документов на русском, английском, французском языках в различных фор- 
матах — ИЕ, 6 Нат! и др.; 

— коллекции фрагментов «переводческой памяти»; 

— комплексы фразовых структур, образующих иерархические системы правил 
для каждого обрабатываемого языка, и описание языков; 

— словари (одно- и двуязычные, специализированные, тематические, общие и 
пользовательские); 

— обрабатываемые системой тексты и их истории («проекты»); 

— файлы конфигурации, профили и истории пользователей системы, описание 
файлового архива системы и прочие служебные файлы. 

Метаданные такого набора разнородной информации образуют сложный информа- 
ционный комплекс, каждая часть которого описывает свой специфический класс данных 
системы. Иерархическая структура метаданных, образующих данный комплекс, приведена 
в табл. 1. 


Таблица 1 — Иерархическая структура комплекса метаданных, описывающих 
архивы интеллектуальной многоязычной системы 


Атрибуты элемента данных как объекта коллекции / архива 


Атрибуты Атрибуты научного Атрибуты 
«проекта» документа / патента словаря 
Атрибуты логической Атрибуты 
структуры документа / патента описания | Атрибуты Атрибуты 
Й структуры элемента 
Атрибуты ее руктур и и 
словаря - 
фрагментации документа / патента р о фразовых 
Атрибуты структур 
описания памяти» 
Атрибуты словного состава 
структуры 
фрагмента текста й 
словарной 
статьи 


Семантико-синтаксические атрибуты слова 


Метаданные, описывающие лингвистическую и металингвистическую информацию 
в системе, удобно структурировать на следующие логические уровни — описания логи- 
ческой структуры документа, описания фрагментации текста документа на удобные для 
дальнейшей обработки блоки (например, фразы), описания словного состава фрагмента и 
описания семантико-синтаксической характеристики каждого слова. 

Метаданные описания логической структуры документа должны полностью описы- 
вать его структуру: название, списки авторов, заголовки, разделы, абзацы, а также списки 
служебных полей (таких как коды, адреса, даты, место работы, тематические области и 
других). Метаданные описания фрагментации текста документа характеризуют разбиение 
самого текста на фразы или фрагменты фраз. 
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Метаданные описания семантико-синтаксических характеристик слова должны 
полностью охватывать его лексические и семантико-синтаксические свойства: часть речи, 
падеж, число, род, вид глагола, лицо, время, наклонение, а также признаки одушевлен- 
ности, «собственности», возвратности, переходности, залога, степени сравнения, уникаль- 
ности форм единственного и множественного числа и другие. Также метаданные описания 
семантико-синтаксических характеристик слова включают в себя атрибуты, построенные 
на основе разработки системы описания полей функционального переноса языка, с учетом 
как отношений зависимости, так и структуры составляющих, что имеет определенное 
сходство с проектными решениями грамматики НР$ЗС [26], [27]. 

Метаданные описания словного состава фрагмента текста охватывают каждый эле- 
мент фрагмента текста с точки зрения его положения во фрагменте, длины, алфавитно- 
цифрового состава и возможных ролей в тексте. Данные характеристики словного элемента 
определяются до выявления его семантико-синтаксических характеристик. Кроме того, в 
качестве словного элемента фрагмента текста рассматриваются не только сами слова, но 
и знаки пунктуации, и любые встреченные внутри фрагмента цифровые и алфавитно- 
цифровые объекты, формулы, возможные сокращения и аббревиатуры. Структура записи, 
характеризующей словный элемент, и ее атрибуты приведены в табл. 2. 


Таблица 2 — Атрибуты описания словного элемента фрагмента текста 
и их значения 


атрибут Описание 
позиция Порядковая позиция словного элемента внутри фрагмента 
текста. 
длина Указывает длину слова в знаках. 
ТИП Указывает тип слова — алфавитное, с дефисом в составе, цифро- 


вое, знак препинания, кавычки, скобки, цифро-буквенное или 
буквенно-цифровое, сокращение, начинающееся с заглавной 
буквы, состоящее из заглавных букв, иноязычное и т.п. 

роль Указывает предполагаемую роль данного словного элемента — со- 
кращение, аббревиатура, название, имя собственное, формула и т.д. 


Метаданные интеллектуальной многоязычной системы независимо от своего фун- 
кционального значения и использования организованы в единую базу метаданных, вклю- 
ченную в ядро системы. В базе метаданных хранятся вместе с атрибутами метаданных их 
значения и описания, а также описание группировки метаданных. Функциональные под- 
системы и модули в процессе обработки текста извлекают из базы метаданных атрибуты 
и значения только используемых в данный момент функциональных групп метаданных. 

Ведение базы метаданных осуществляется с помощью специальной подсистемы 
ядра интеллектуальной многоязычной системы, доступной только специально уполномо- 
ченному пользователю. Таким образом, при необходимости обновления или расширения 
пространства метаданных, например добавления в систему нового языка или объекта, 
достаточно просто добавить в базу метаданных массив необходимых атрибутов, все- 
сторонне описывающий вводимый объект. 


6 Трансфер пропозиционального ядра 
в русско-французской языковой паре 


Основу семантико-синтаксической структуры предложения составляет пропозицио- 
нальное ядро, прежде всего, языковые средства предикации. Были изучены структуры 
когнитивного переноса в рамках поля функционального переноса (ПФП) первичной и 
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вторичной предикации для русско-французской языковой пары по аналогии с русско- 
английской языковой парой. Были выделены базовые правила когнитивного переноса 
для различных функциональных значений (частотные характеристики были выделены 
на основании анализа патентных текстов). Материалом анализа послужили параллель- 
ные тексты патентов и/или рефератов патентов на русском и французском языках, взятые 
из базы данных Роспатента. 

Сравнение русских и французских текстов рефератов научных патентов показало, что 
доля действительно параллельных текстов в них составляет примерно 30%. Остальные 
тексты можно назвать когнитивно-сопоставимыми, причем объем русского текста может 
превышать объем французского на две трети. Однако распределение по частям речи в рус- 
ских и французских научных текстах патентных рефератов (и самих патентов) очень близко 
по составу и объёму, что отражено на рис. 1. Русский текст в целом на 30 — 35% более 
номинативен, чем французский, в котором в поле вторичной предикации предпочтение 
отдаётся инфинитиву (в русском — отглагольным существительным). 


Сравнение русского и французского рефератов по объему и составу частей речи 
Реферат патента И’О2004009333 Реферат патента И’О2004017987 


Е 
ПО довприч (Герушый [о 


ЕО ООС ОЕ О 
РТ ОО ОИ ПО ОИ 


Рисунок 1 — Распределение по частям речи в русских и французских 
научных текстах патентных рефератов 
В первом примере тексты рефератов не параллельные, а когнитивно-сопоставимые, 
во втором тексты русского и французского реферата параллельны: перевод выполнен 
точно, почти дословно. В любом случае, как видно из примеров, и в русских, и во фран- 
цузских патентных текстах существенно высока доля именных групп, что вообще всегда 
характерно для научно-технических текстов. 


6.1 Сравнение морфологических способов выражения 
цели действия в русском и французском языках 


Правила когнитивного переноса для функциональных значений цели и назначения 
представлены на следующей схеме (рис. 2). 


Цель, назначение 


Русский язык Франиузский язык 
Существительное (98) Инфинитив (72) 

Инфинитив (2) <-> Существительное (26) 
Придаточное предложение (0) Придаточное предложение (2) 


Рисунок 2 — Правила когнитивного переноса 
для функциональных значений цели и назначения 
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Таким образом, набор структур, используемых для выражения цели действия, оди- 
наков для русского и французского языков, однако французский тяготеет к инфинитив- 
ной структуре, а русский — к именной (Для увеличения способности сети к обобщению... / 
Айп ’аизтешег [а сарасие ди тёзеаи 4е эепегайбег...). 

Примеры:. 

1. [Саё: УеМоин] {для распознавания} {роиг (а гесоппа55апсе} — предложная 
группа: предлог + существительное. 

2. [Саё: УеЬш{ | {чтобы распознать} {айпи 4е гесоппайге} — союз + инфинитив. 

3. [Саё: Зещепсе] {чтобы распознавание было эффективным} {роиг дие [а гесоппа!- 
55апсе 5ой ейсасе} — придаточное предложение, присоединяемое подчинительной связью 
(союзом цели). При трансформации русского отглагольного существительного во фран- 
цузский инфинитив необходимо сделать выбор между его активной и пассивной формой. 
Видимо, в рамках системы автоматического перевода данный выбор лучше всего осущест- 
вляется с применением статистических данных (активный инфинитив встречается в текстах 
намного чаще пассивного; в анализируемых текстах французский пассивный инфинитив в 
качестве перевода русского отглагольного существительного встретился в 13% случаев). 


7 Сравнение морфологических способов 
выражения предшествования / следования 
в русском и французском языках 


Данные по количественному распределению случаев использования различных 
морфологических способов выражения предшествования / следования для русского 
и французского языков, полученные при анализе патентных текстов приведены на 
рис. 3. 


Предшествование / следование 


Русский язык Франиузский язык 
Существительное (89) Существительное (90) 
Придаточное предложение Инфинитив (10) 

Инфинитив (2) <> Придаточное предложение (0) 
Деепричастие (0) Причастие (0) 


Рисунок 3 — Количественное распределение случаев использования различных 
морфологических способов выражения предшествования / следования 


Примеры: 

1) перед\после + МР (существительное) — предложная группа (перед + сущест- 
вительное в творительном падеже): ...мешки, перед использованием порошка, например, 
для изготовления бетона. 

2) атапцаргез + МР (существительное): Ауаи! ийЙзайоп аап5 [а геасНоп, [е те! 
сотепи 4апу [е сиайузеиг 4ой ее геций. 

В патентных текстах частотность конструкций вида предлог [перед (ауап®\ после 
(аргез)] + существительное в обоих языках практически одинакова; существенно реже 
придаточные предложения (в русском); французский язык придаточному предложению 
предпочитает инфинитивный оборот. 


7.1 Таксисные значения, реализуемые в полипредикативных конструкциях 


Самые частотные правила когнитивного переноса в анализируемых текстах сле- 
дующие: французское придаточное относительное предложение вида (3451{\УР-МР\+ 
+52 {Ргоп теаКаи -НМР-+УР}}) русское причастие. Наиболее продуктивные типы конст- 
руктивных трансформаций при французско-русском переводе коррелируют со сле- 
дующими аспектуально-таксисными значениями [28]: 
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— таксис одновременности с основным глаголом на линейной цепочке сложного 
предложения, функционально соответствует рагис1ре ргёзепе: Оие ППеге гестоире 1оше$ [е5 
аспуИе5 ргодистсе; ди сопсоигет а [а аБтсайоп ип ЫШеп... / Производственно-тех- 
нологическая цепочка объединяет все этапы производственной деятельности, связанные с 
изготовлением какого-либо продукта... Конечно, в этой ситуации достаточно часты и 
совпадения конструкций (около 35%) — фр.: Си(аи)) + У(@п) - рус.: Сш(который) + 
У(Ёп): Дату Фашгез веб сопшиех ип т@апзе ФйуадгохургорусеЙиозе её 4е сие 
фашттит её 4е таэпеяит, оп оБегуе еощететй ипе сйше 4е 15со5йе аи соигу Чи 4етру 
ди етгате ипе зейтетайоп 4е; аси еп зизрепзтоп е ипе паетовепейе а4е [а- Абрегяюп 
Аапи5 [е ргодий рт. / В других гелях, содержащих смесь гидроксипропилцеллюлозы и сили- 
ката алюминия и магния, также со временем отмечают понижение вязкости, которое 
вызывает осаждение активных веществ, находящихся в суспензии, и неоднородность 
дисперсии в конечном продукте; 

— таксис предшествования и завершённости (исчерпанности) внутреннего времени 
действия — французские полипредикативные конструкции с инфинитивом прошедшего 
времени (шЯшШ{ раззе) вида (5{51 {Ш разз{Соп] {аргё$, 46$ аае, аз ОЕ дие 1 -ЕШЁ разз} }+ 
+52 {МР+УР}}); выражают предшествование на линейной цепочке, а в независимых пред- 
ложениях и на оси времени). На русский язык может переводиться деепричастием (чаще 
всего) либо причастием или придаточным относительным предложением. Тут реализует- 
ся ограничительная функция временных союзов, задающих ограничение действия опре- 
делённым пределом, и накладывается семантика этих союзов, «подкрепляя» граммати- 
чески присущее инфинитиву прошедшего времени значение предшествующего действия: 
Артёх ауой' теси 4е 5а Бапдие ип аб Алтрауе... / Получив от своего банка извещение об 
отказе в оплате... 


7.2 Особенности перевода французского абсолютного причастного оборота 


Французский абсолютный причастный оборот — Ргороз оп рагстре абзое (может 
быть выражен формами рагйстре ргёзеп! — непредшествование, обычно одновременность; 
рагйстре раз56, рагастре разз6 сотрозё — предшествование) — выступает как придаточное 
предложение, у которого имеется собственное подлежащее, отличное от подлежащего 
главного предложения: (5 {51 {Ргороз!юоп рае аб$ МР-+Раи рг ОК МР-Рай разз ОВ МР + 
+Рай разз сотр}, 52 {МР+УР}}). Данный оборот не имеет аналогов в русском языке. 
Чаще всего выражает отношения причины или временные отношения. Реализует следую- 
щие значения. 

— Причина и одновременность. Обороты со значением причины обычно переводят- 
ся на русский придаточными с союзами так как, поскольку, потому что; когда, после того, 
как или, реже, обстоятельствами или деепричастиями: [е тауай аи аетеигат @ай 4’ипе 
ехтёте йтрйсйе, [а тасйте @ат! ргездие епйегетет аиютайцие. / Поначалу работа была 
чрезвычайно проста, так как (потому что) станок действовал почти автоматически. 
Отметим, что это предложение можно перевести на русский язык иначе: Когда станок 
действовал почти автоматически, работа была чрезвычайно проста. Но в таком пере- 
воде семантика причинной обусловленности скрыта, хотя таксис (одновременность) не 
нарушен. 

— Причина и предшествование. Временные отношения в русском языке выражаются 
с помощью союзов когда; как только; тотчас, после того как; едва только; сразу после того 
как... Во французских предложениях абсолютный причастный оборот может не иметь 
лексически выраженных временных показателей; тем не менее, часто добавляются наречия 
со значением немедленного предшествования: 45501, 5И0Е, а рете, ипе 15. Например: Ипе 
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аг4еиг 4е 'гауай Гауат 5оидат геузсйя1, И 5е газзй АеуатЕ за 1аЫе. / [Поскольку] его внезапно 
охватила жажда работы, он снова уселся за стол. Тут французский оборот выступает с 
основным для него аспектуально-таксисным значением предшествования, усиленным 
семантикой наречия зоидат «внезапно». 

— Комитативное значение (дополнительного действия), при переводе используют- 
ся союзы причём, также, таким образом, и: Раиз [а ргайдие сёа 4еугай 5е гадите раг 250 
гергезетайоп раг ап, [е рибЙс ауапЕ [е сйохх... / На практике это должно будет означать 
250 представлений в год, причём зрители смогут выбирать... 

— Временные отношения: а) предшествования: Ге {гауай ауап Цетт!те, И 5е геюигта... 
/ После того, как работа была завершена, он вернулся... Б) одновременности: [е ргоосо[ 5е 
Пат, [е зуете гауаШе... / Пока считывается протокол, система работаеи... 

Абсолютный причастный оборот представляет большие трудности для машинного 
перевода как по причине отсутствия подобной синтаксической конструкции в русском 
языке, что вынуждает прибегать к трансформациям, так и по причине «диффузности» 
значения самой французской конструкции, особенно, если отсутствуют эксплицитно вы- 
раженные маркеры временных отношений. 


Заключение 


Современный этап исследований в области проектирования систем обработки естест- 
венного языка ставит задачу оптимального сочетания сильных сторон двух исследова- 
тельских парадигм: логико-лингвистического моделирования, использующего правила, 
и стохастического подхода. 

В данной статье рассмотрены вопросы создания нового системного подхода к из- 
влечению лингвистических и предметных знаний из параллельных текстовых корпусов на 
нескольких европейских языках (русском, английском, французском), позволяющего осу- 
ществить семантическое выравнивание значимых текстовых сегментов, для решения задач 
машинного перевода и обработки текстовых знаний. Предлагаемый подход основан на 
функционально-семантических представлениях языковых структур и статистических методах. 

В рамках научно-исследовательской работы было проведено семантическое вы- 
равнивание фокусной группы параллельных текстов, сформированы фокусные обу- 
чающие выборки и проведен сбор статистических данных о типах изосемичных языковых 
структур в русском, английском и французском, немецком и итальянском дискурсе. 

Рассмотрены статистические методы анализа языковых объектов, сформирован ап- 
парат вероятностных расширений логико-лингвистических правил и выработаны методы 
создания алгоритмов разбора и трансфера языковых структур, сформированы статисти- 
ческие портреты семантических групп языковых явлений (полей функционального 
переноса), выявлены наиболее частотные соответствия в пределах семантических групп 
для каждого из рассматриваемых языков. 
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Е.Б. Козеренко, Н.В. Лунева, Г.В. Галина, Ю.. Морозова 

Лнгвстичн! та металнгв!стичн! представлення в 1нтелектуальних багатомовних системах 

У давй робот! запропоновано функцюнально-семантичний шдх!д, який забезпечуе синергетичне 
сполучення статистичних методв 1 ломко-л1нгв1стичних правил. У процес! граматичного розбору 
використовуються значення Имов!рност! кожного вузла розбору речення. Взаемодля функщюнальних 
блокв 1 шдсистем 1нтелектуально! багатомовно! системи мж собою, а також взаемод1я П з 
користувачем органзуеться за допомогою метаданих керування 1 зв’язку. Були вивчен! структури 
когнтивного переносу у межах поля функщюнального переносу первинно] 1 вторинно! предикаци для 
росйсько-французько! мовно] пари за аналогею з росйсько-англИйською мовною парою. Матер1алом 
анал1зу послужили паралельн! тексти, статт! з науково! пер1одики. 


Е.В. Козегепко, М.Г. Гипета, 1.И.Сайта, Л. Могозоуа 
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